1
O Método Científico para Otimização em HIP
AI024Lesson 7
00:00

A otimização no ambiente HIP deve ser tratada como uma disciplina empírica rigorosa e não como uma série de palpites intuitivos. Ao adotar um fluxo de trabalho sistemático, os desenvolvedores garantem que cada modificação de código seja justificada por dados, afastando a engenharia de desempenho da "superstição de otimização" e levando-a a um ciclo repetível e científico de hipótese e verificação.

O Fluxo de Trabalho de 6 Etapas

As diretrizes de desempenho do HIP recomendam uma sequência sistemática:

  1. Medir uma base: Determine o tempo atual de execução e a taxa de transferência.
  2. Perfil do programa: Use rocprofv3 para coletar contadores de hardware.
  3. Identificar o gargalo: Determine se você está limitado por computação, memória ou latência.
  4. Aplicar otimizações direcionadas: Foque apenas no gargalo identificado.
  5. Re-medir: Verifique se a mudança realmente melhorou o desempenho.
  6. Iterar: Repita o processo até atingir os objetivos.
1. Medir a Base2. Perfil3. Identificar o Gargalo4. Otimizar

Evite Superstições de Otimização

Ganhos de desempenho devem ser resultados reprodutíveis de interações específicas com o hardware. Evite esses padrões anti-tipo:

  • Alterar o código do kernel antes de medir o desempenho atual.
  • Ajustar o tamanho do bloco sem saber se o kernel é limitado pela memória.
  • Perseguir números de ocupação sem prova de que eles importam para a carga de trabalho específica.
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>